Data-Driven Classroom
Part II: Intentional Assessment
ผศ.ดร.สิวะโชติ ศรีสุทธิยากร
คณะครุศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
2025-08-18
Data-Driven Classroom Cycle
Intentional Assessment
![]()
การประเมินแบบมีเป้าหมาย (intentional assessment) คือกระบวนการเก็บและใช้ข้อมูลการเรียนรู้อย่างมีวัตถุประสงค์ชัดเจน เชื่อมโยงกับเป้าหมายการเรียนรู้ เพื่อพัฒนาผู้เรียนอย่างต่อเนื่อง
ทำความเข้าใจทั้งความก้าวหน้าและอุปสรรคของผู้เรียน
ให้ข้อเสนอแนะที่นำไปใช้ได้จริง (actionable feedback)
ใช้เป็นฐานในการวางแผนช่วยเหลือเชิงรุกอย่างแม่นยำและทันท่วงที เพื่อการพัฒนาผู้เรียนอย่างต่อเนื่อง
The word “assessment” originates from the Latin word “assidere,” meaning “to sit beside”. In education, this translates to teachers sitting beside students, observing their work, and gathering information about their learning progress.
Principles of Intentional Assessment
กรอบแนวคิด 4P ของ Intentional Assessment
1. Propose-Driven (ตามเป้าหมาย)
- ประเมินเฉพาะสิ่งที่สอดคล้องกับเป้าหมายการเรียนรู้
- หลักฐานที่ได้ต้องมีความหมาย ไม่ใช่แค่ตัวเลข
- การประเมินไม่ได้ทำเพื่อเก็บคะแนน แต่หา insight เพื่อสนับสนุนการเรียนรู้ของผู้เรียน
2. Process-Enhanced (เน้นกระบวนการ)
- มุ่งวัดทั้ง “กระบวนการเรียนรู้” ไม่ใช่แค่ผลลัพธ์
- พยายามให้เห็นกระบวนการคิด กระบวนการทำงาน
- ใช้งานจริง/สร้างสรรค์ เช่น portfolio, reflection, project
- Nested Assessment, Multi-Modal Assessment, Authentic Tasks
3. Personalized (สอดคล้องผู้เรียน)
- ออกแบบการประเมินที่ยืดหยุ่นกับแต่ละคน
- Feedback และคำแนะนำที่ตรงกับความต้องการ
4. Proactive Prevention (ป้องกันเชิงรุก)
- ใช้การประเมินตรวจจับสัญญาณเสี่ยงล่วงหน้า
- รีบวางแผนช่วยเหลือก่อนปัญหาจะบานปลาย
Intentional Assessment
Propose-Driven – คุณภาพคำตอบ
- ตรวจสอบว่าเข้าใจ learning goal
- ประเมินจากตัวเลือกที่เลือกใน quiz แบบ multiple choice
- ประเมินจากคุณภาพคำตอบอัตนัยด้วยใช้ rubric
Process-Enhanced – เวลา & รูปแบบการตอบ
- submit ทัน/ช้า = วินัย & การจัดการเวลา & ความรับผิดชอบ
- คำตอบอัตนัยสั้น/ยาว = วิธีคิดที่ต่างกัน
- คำตอบที่ผิดปกติในเชิง logic หรือกระบวนการคิด
Personalized – คุณภาพคำตอบรายบุคคล - เห็นความต่างของแต่ละคน
- Feedback เฉพาะบุคคล (ชี้ให้เห็นจุดแข็ง + ชี้สิ่งที่ควรพัฒนา)
- ตรวจการลอกงาน -> ถ้าคำตอบซ้ำกันเกินพอดี -> …
Proactive Prevention – การส่ง/ไม่ส่งงาน
- ไม่ส่ง/ส่งช้า = สัญญาณเสี่ยง -> เฝ้าระวังในอนาคต
- ครูเรียกคุย/เสริมกิจกรรมก่อนปัญหาจะบานปลาย
- ในอนาคตหากนักเรียนคนเดิมมีพฤติกรรมลอกซ้ำ ๆ = แนวโน้มเสี่ยงมากขึ้น -> ?
- คำตอบที่ผิดปกติมาก ๆ อาจสะท้อนว่านักเรียนมีปัญหาในการทำความเข้าใจบทเรียน
ตัวอย่างผลการวิเคราะห์การบ้าน (ปรนัย)
ตัวอย่างผลการวิเคราะห์การบ้าน (ปรนัย)
บางกรณี intentional assessment สามารถให้ข้อมูลป้อนกลับเกี่ยวกับการจัดการเรียนรู้ และการวัดประเมินของผู้สอนได้ด้วย
Data
คือ ข้อเท็จจริง (fact) หรือ หลักฐาน (evidence) ที่สามารถวัดหรือสังเกตได้ และสามารถบ่งชี้สภาพของสิ่งใดสิ่งหนึ่ง ไม่ว่าจะเป็นตัวผู้เรียน กระบวนการเรียนรู้ หรือบริบทการเรียนรู้
Type of Data
ข้อมูลเชิงปริมาณ (quantitative data) คือข้อมูลที่มีการเก็บบันทึกค่าเป็นตัวเลขที่มีความหมาย เช่น น้ำหนัก ส่วนสูง คะแนนสอบ จำนวนครั้งที่เข้าเรียนของนักเรียน เวลาท่ี่นักเรียนใช้ในการทำแบบฝึกหัด (นาที) จำนวนครั้งที่นักเรียนเข้าดูเนื้อหาในระบบ LMS ผลการประเมินการบ้าน (คะแนน)
ข้อมูลจัดประเภท (categorical data) คือข้อมูลที่ค่าของข้อมูลไม่ได้มีความหมายในเชิงปริมาณ แต่มีความหมายในเชิงคุณลักษณะ หรือการแบ่งกลุ่ม/หมวดหมู่ของหน่วยข้อมูล เช่น เพศของนักเรียน สถานะการเข้าเรียน (เข้าเรียน/ขาดเรียน) ผลการประเมินโครงงาน (ดี/พอใช้/ต้องปรับปรุง) สถานะการส่งการบ้านของนักเรียน (ตรงเวลา/ล่าช้า)
Type of (Classroom) Data
Three-Tier Framework
| Tier 1: Predictive Assessment |
Academic, Behavioral, Demographic, Contextual |
**Predictive Analytics**: ใช้ข้อมูลย้อนหลัง 2–3 ปี เพื่อสร้างแบบจำลองคาดการณ์ความเสี่ยงของผู้เรียนก่อนเริ่มเรียน หากไม่มีข้อมูลเพียงพอ Tier นี้จะทำงานได้ไม่เต็มที่ |
| Tier 2: Responsive Assessment |
Academic, Behavioral, Contextual |
**Descriptive & Diagnostic Analytics**: กำกับติดตาม/วิเคราะห์หาสาเหตุของปัญหาการเรียน เช่น วิเคราะห์จุดอ่อนของผู้เรียนผ่านงาน การตอบคำถาม หรือพฤติกรรม |
| Tier 3: Summative/Intensive Assessment |
All types: Academic, Behavioral, Contextual, Well-being & Social, Demographic |
**Evaluative Data Mining**: การประเมินว่าระบบการทำนาย การวินิจฉัย และ intervention ที่ใช้ในกระบวนการจัดการเรียนรู้ที่ผ่านมาได้ผลจริงหรือไม่ ผู้สอนอาจทำ mini-summative assessment สำหรับ intensive support |
Generative AI: What It Is and Why It Matters
Generative AI คือระบบปัญญาประดิษฐ์ที่สามารถสร้างข้อมูลใหม่ เช่น ข้อความ รูปภาพ เสียง โค้ด หรือวิดีโอ โดยอิงจากรูปแบบ (patterns) และโครงสร้าง (structures) ที่เรียนรู้จากข้อมูลจำนวนมาก
กระบวนการสร้างไม่ได้เกิดจากการสุ่ม แต่เป็นการ คำนวณทางสถิติ
เพื่อหา “ผลลัพธ์ที่มีความเป็นไปได้สูงสุด” ภายใต้บริบทที่กำหนด
การสร้างเนื้อหาต้องอาศัย:
- Context: บริบท เช่น ข้อความก่อนหน้า หรือข้อมูลแวดล้อม
- Prompt: คำกระตุ้นที่ระบุภารกิจ รูปแบบ หรือเจตนาของผู้ใช้
ผลลัพธ์ที่ได้จึงไม่ใช่ “ของใหม่โดยสมบูรณ์” (original content) แต่เป็นการจัดเรียงองค์ประกอบใหม่ตามความน่าจะเป็นของการเกิดร่วมกันของคำหรือพิกเซล ที่ คล้ายคลึงกับสิ่งที่เคยเรียนรู้มา แต่มีความยืดหยุ่นและสร้างสรรค์เพียงพอที่จะใช้งานในหลากหลายบริบท และตรงตามวัตถุประสงค์
Generative AI: หลักการทำงาน
Generative AI for Intensional Assessment
ตัวอย่างการใช้งาน Generative AI
ช่วยออกข้อสอบ data-driven classroom เกี่ยวกับ intentional assessment ให้ข้อนึงสิ
ตัวอย่างการใช้งาน Generative AI
ปัญหา Hallucination
ปัญหา Hallucination
![]()
AI hallucination หมายถึงกรณีที่ระบบปัญญาประดิษฐ์ (AI) สร้างเนื้อหาหรือคำตอบที่ ไม่ได้อิงจากข้อมูลจริงหรือข้อมูลที่ได้รับมา ซึ่งอาจทำให้ AI สร้างข้อมูลที่ไม่ถูกต้อง นำไปสู่ความเข้าใจผิด หรือแต่งขึ้นทั้งหมด ซึ่งอาจก่อให้เกิดปัญหาในหลายบริบทของการใช้งาน
สร้างข้อมูลเท็จโดยสิ้นเชิง (total fabrication) – สร้างแก่นของเรื่องราวที่ไม่มีอยู่จริงขึ้นมาทั้งหมด เช่น อ้างอิงหลักฐานข้อมูลผิด ให้เหตุผลผิด นำไปสู่การสร้างข้อสรุปผิด
ผสมผสานระหว่างข้อมูลจริงและเท็จ (mixing true & false) – หลักการโดยรวมถูกต้อง แต่อาจยกตัวอย่างหรือหลักฐานข้อมูลประกอบที่ไม่มีอยู่จริง
สรุปความเกินจริง (faulty inference) – ข้อมูลตั้งต้นถูก แต่ข้อสรุปตีความเกินขอบเขตการอ้างอิงของข้อมูล
ปัจจัยที่มีผลต่อความถูกต้อง/เหมาะสมของผลลัพธ์
Model
พื้นความรู้เดิม (Knowledge Base) โมเดลถูก train มาด้วยข้อมูลอะไรบ้าง สิ้นสุด ณ ตอนไหน มีความเป็นปัจจุบันมากน้อยแค่ไหน
สถาปัตยกรรมของโมเดล
ขนาดและความสามารถในการให้เหตุผล โมเดลขนาดใหญ่มักมีความสามารถในการคิดเชิงเหตุผล หรือคิดในปัญหาซับซ้อนได้ดีกว่า
การปรับจูนเฉพาะทาง (Fine-tuning) ช่วยให้โมเดลเข้าใจบริบทเฉพาะทางได้ดีขึ้น
Prompt
กระบวนการกระตุ้นเพื่อให้ LLM แสดงผลลัพธ์ตามที่ต้องการ
Prompt ชัดเจน ไม่กำกวม และบอกสิ่งที่ต้องการอย่างละเอียด จะได้ผลลัพธ์ที่ดีกว่า
เทคนิคการ Prompt ที่แตกต่างกันอาจให้ผลลัพธ์แตกต่างกันไปด้วย (อาจไม่จริงเสมอไปโดยเฉพาะกับโมเดลขนาดใหญ่ที่มีประสิทธิภาพสูง เช่น gpt-o1, gpt-o3)
Context
ข้อมูลแวดล้อมที่ป้อนเข้าไปพร้อมกับ Prompt เช่น เนื้อหาจากเอกสาร, บทสนทนาก่อนหน้า, หรือข้อมูลเฉพาะที่โมเดลไม่เคยรู้มาก่อน
กระบวนการจัดหา Context ที่ถูกต้องก็เป็นปัจจัยที่มีผลด้วย
เทคนิคการออกแบบ Prompt : In-Context Learning Strategy
Zero-Shot Prompting
One-Shot Prompting
Few-Shot Prompting
Chain-of-Thought
Template Design
Template Design
“คุณภาพของ prompt ส่งผลต่อคุณภาพของผลลัพธ์”
Template Design
“คุณคือครูประจำชั้น ช่วยร่างข้อความแจ้งผู้ปกครองเรื่องเปลี่ยนวันประชุมผู้ปกครอง จากวันที่ 13 มิถุนายน 2568 เป็นวันที่ 20 มิถุนายน 2568 โดยใช้ภาษาสุภาพ เหมาะสมกับการสื่อสารทางการศึกษา ความยาวไม่เกิน 10 บรรทัด”
| 1. Task |
ช่วยร่างข้อความแจ้งผู้ปกครอง |
| 2. Context |
เรื่องเปลี่ยนวันประชุมผู้ปกครอง จากวันที่ 13 เป็นวันที่ 20 มิ.ย. 2568 |
| 3. Specification |
ใช้ภาษาสุภาพ เหมาะกับการสื่อสารทางการศึกษา ไม่เกิน 10 บรรทัด |
Prompt ที่ดีนำไปสู่ผลลัพธ์ที่ดี
Chain-of-Thought (CoT) (1)
Chain-of-Thought Prompting คือเทคนิคการออกแบบ prompt ที่ให้โมเดลภาษารู้จักการคิดแบบมีเหตุผลเป็นขั้นเป็นตอน หรือแสดงวิธีคิด/วิธีทำออกมาก่อนจะสรุปเป็นคำถามสุดท้าย (step-by-step reasoning)
แทนที่จะให้โมเดลตอบทันที…
ใช้ prompt กระตุ้นให้โมเดลแจกแจงกระบวนการคิด การให้เหตุผล วิธีการคำนวณ หรือการดำเนินงานเพื่อนำไปสู่ผลลัพธ์ออกมาทีละขั้น
Chain-of-Thought (CoT) (2)
Zero-Shot Prompting + Context
AI Usage Framework
Human in the Loop Framework
Generative AI for Intentional Assessment
Item/Quiz Generator
Generative AI สามารถ
สร้างข้อสอบตาม learning objective
ปรับข้อสอบตาม Bloom’s Taxonomy หรือกรอบแนวคิดอื่น ๆ ตามที่กำหนด
ใส่บริบทที่เหมาะสมกับผู้เรียน
อธิบายเหตุผลของคำตอบเพื่อการตรวจสอบและการเรียนรู้
โครงสร้าง prompt ที่ดีควรประกอบด้วย –> ตัวอย่าง
- วิชา / หัวข้อ
- กลุ่มเป้าหมาย (ระดับชั้น, ความรู้พื้นฐาน)
- วัตถุประสงค์การเรียนรู้
- เนื้อหา
- ประเภทข้อสอบ (MCQ, Short Answer, Essay)
- จำนวนข้อ
- ระดับความยาก
- บริบท/สถานการณ์ (Contextualization)
- เฉลย + คำอธิบาย + Rationales
...
Item Analysis + Generator (1)
Item Analysis + Generator (2)
Automated Scoring + Feedback
Gen AI เช่น ChatGPT สามารถตรวจคำตอบของโจทย์ปัญหาได้ และยังสามารถตรวจให้ผู้เรียนเป็นรายบุคคลโดยอัตโนมัติ
ถ้าคำถามมีความซับซ้อนอาจแบ่งการป้อน prompt เป็นส่วนย่อย ๆ เช่น ส่วนสอนหรือปรับแต่งเฉลยคำตอบ ส่วนตรวจให้คะแนน และส่วนให้ผลป้อนกลับ
Automated Scoring + Feedback
Gen AI เช่น ChatGPT สามารถตรวจคำตอบของโจทย์ปัญหาได้ และยังสามารถตรวจให้ผู้เรียนเป็นรายบุคคลโดยอัตโนมัติ
ถ้าคำถามมีความซับซ้อนอาจแบ่งการป้อน prompt เป็นส่วนย่อย ๆ เช่น ส่วนสอนหรือปรับแต่งเฉลยคำตอบ ส่วนตรวจให้คะแนน และส่วนให้ผลป้อนกลับ
Automated Scoring + Feedback
Gen AI สามารถส่งไฟล์ผลการประเมินและการให้ feedback กลับมาเพื่อนำไปใช้ต่อได้
Automated Scoring + Feedback
Automate Essay Scoring
### prompt 1
หากจะพัฒนาทัศนภาพข้อมูลข้างต้นให้ดียิ่งขึ้น นิสิตคิดว่าควรพัฒนา/ปรับเปลี่ยนทัศนภาพข้อมูลในประเด็นใดบ้าง
แนวทางเฉลย:
1. ทัศนภาพข้อมูลนี้ใช้ pie chart แทนปริมาณที่เป็นคะแนนเฉลี่ยรายวิชาคณิตศาสตร์ที่จำแนกตามกลุ่มนักเรียน ซึ่งไม่เหมาะสม ควรใช้ bar chart หรือทัศนภาพอื่นที่ใช้นำเสนอปริมาณไม่ใช่สัดส่วน ---> Untrustworthy
2. ใช้จานสีแบบ sequential แทนที่จะเป็น qualitative palette แทนกลุ่มนักเรียน ---> not accessible
ดังนั้นประเด็นการพัฒนาปรับเปลี่ยนให้ดีขึ้นต้องตอบ 2 ประเด็น
1. เปลี่ยนทัศนภาพข้อมูลให้เป็นแผนภูมิแท่ง หรือแผนภูมิอื่นที่ใช้นำเสนอปริมาณ/เปรียบเทียบข้อมูล ไม่ใช่สัดส่วน
2. เลือกจานสีแบบ qualitative palette ให้เหมาะกับประเภทตัวแปรสไตล์การเรียนรู้
จำไว้ก่อน
### prompt 2
ไฟล์นี้เป็นผลการตอบคำถามแบบอัตนัยรายคนของนักเรียนในข้อสอบข้างต้น ช่วยตรวจความถูกต้องโดยให้คะแนนเป็นรายคนดังนี้
2 คะแนน ตอบถูกต้องทั้งสองประเด็น
1 คะแนน ตอบถูกต้อง 1 ประเด็น
0 คะแนน ไม่ถูกต้องเลย
แล้วสร้างผลการตรวจเป็นคอลัมน์ที่ 5 แล้วส่งไฟล์กลับมาหน่อย
AI Automation
AI Automation
AI Usage Framework
Human in the Loop Framework